
万帧?单卡!智源研究院开源轻量级超长视频理解模型Video-XL-2
万帧?单卡!智源研究院开源轻量级超长视频理解模型Video-XL-2长视频理解是多模态大模型关键能力之一。尽管 OpenAI GPT-4o、Google Gemini 等私有模型已在该领域取得显著进展,当前的开源模型在效果、计算开销和运行效率等方面仍存在明显短板。
长视频理解是多模态大模型关键能力之一。尽管 OpenAI GPT-4o、Google Gemini 等私有模型已在该领域取得显著进展,当前的开源模型在效果、计算开销和运行效率等方面仍存在明显短板。
在刚刚结束的 Google I/O 开发者大会中,Google 宣布上线由 Gemini 驱动的高级 AI 搜索模式 AI Mode,可以应对复杂问题,支持追问。与之前的 AI Overviews 对 AI 搜索的浅尝辄止不同,Google 终于不再死抱着“关键词+链接列表”,开始拥抱“自然语言交互+结构化答案”的“新”范式了。
Agent 太多了,为了不让订阅费掏空我的钱包,我会通过苹果的屏幕使用时间以及 gemini 统计网页的访问次数来汇总每周使用频率。
2025 年 4 月的 AI 月报,你会看到:“评估(Evals)” 成为模型和 AI 产品开发的关键词;Google 继续提升 Gemini 模型能力的思路; OpenAI 的 GPT-4o 为什么变得谄媚,以及背后的问题;用户规模与模型能力提升关系不大?可能要有变化了
紧接着 Gemini 开了教育优惠之后,Cursor Pro 在昨晚也提供了教育优惠,融到钱了就是财大气粗!在校学生凭 edu 邮箱可以直接验证领取一整年的免费 Cursor Pro,具体的教程可以去小红书上搜。但目前网上的教程全需要教育邮箱,作者本人亲测无需在校身份,无需 edu 也可白嫖~教程如下:
宝子们,今天必须给大家分享一个超重磅的消息!最近,两款超厉害的 AI 助手 ——Cursor Pro 和 Gemini Pro,居然都宣布面向学生群体免费开放使用一整年!这可真是实打实的福利,错过可就亏大啦!
因为大家太过热情, Gemini 2.5提前重磅更新—— 史上最强编码模型Gemini 2.5 Pro Preview的I/O版。
你的默认编程模型是什么?或许可以换一换了。刚刚,Google DeepMind 发布了 Gemini 2.5 Pro 的最新更新版本:Gemini 2.5 Pro (I/O edition)。其最大的进步是编程能力大幅提升,不仅在 LMArena 编程排行榜上名列第一,同时也在 WebDev Arena 排行榜上更是以显著优势超过了昔日霸
AI 编程助手的不断升级,让越来越多开发者将它们融入实际项目流程中。然而,不同模型与工具之间的体验差异,往往让人又爱又恨。本文作者在尝试用 Claude 开发游戏并为此付出 417美元后,再次挑战使用 Gemini 2.5 + Cursor 打造新作——而这一次,不仅完全免费,整体开发体验也“大幅超预期”。
在 Gemini 的爆火之后,Google Cloud 正在成为真正意义上的「基础设施」。